LLaMA

LLaMA (ראשי תיבות: Large Language Model Meta AI, בעברית: מודל שפה גדול מטא בינה מלאכותית) הוא מודל שפה גדול (LLM) ששוחרר על ידי מטא בפברואר 2023. השם מתייחס לסדרת מודלים שלכל אחד מספר פרמטרים שונה (מ-7 מיליארד ועד 65 מיליארד פרמטרים). לטענת מפתחי לאמה, ביצועי מודל ה-13 מיליארד במשימות עיבוד שפה טבעית, עולים על אלו של GPT-3, הגדול בהרבה (175 מיליארד פרמטרים).

המייחד את מודלי לאמה ממודלי השפה הגדולים האחרים באותה תקופה, היא שהאחרונים היו זמינים לרוב רק דרך ממשקי API מוגבלים (אם בכלל), בעוד מטא פרסמה את משקלי המודל של לאמה לקהילת המחקר ברישיון לא מסחרי. שבוע לאחר השחרור, משקולות המודל הודלפו באינטרנט כך שהלכה למעשה הוא נהפך לפתוח לציבור.

ב-18 ביולי 2023, Meta הכריזה על הדור הבא של מודלי הלאמה, בשם LLaMA 2.^[1] המודלים שוחררו לציבור בקוד פתוח. חודש לאחר מכן, שחררה מטא גרסה ייעודית של המודל לכתיבת קוד, בשם Code LLaMA. גרסה זו היא למעשה אימון המודל לאמה 2 על כחצי טריליון טוקנים (יחידות טקסט קטנות, למשל מילה) של קטעי קוד.^[2]

^ "Llama 2". Meta AI (באנגלית). נבדק ב-2023-07-18.
^ Introducing Code Llama, an AI Tool for Coding, Meta, ‏2023-08-24 (באנגלית אמריקאית)

[1] "Llama 2". Meta AI (באנגלית). נבדק ב-2023-07-18.

[2] Introducing Code Llama, an AI Tool for Coding, Meta, ‏2023-08-24 (באנגלית אמריקאית)

[1]

[2]